home *** CD-ROM | disk | FTP | other *** search
/ CU Amiga Super CD-ROM 21 / CU Amiga Magazine's Super CD-ROM 21 (1998)(EMAP Images)(GB)[!][issue 1998-04].iso / CUCD / Online / AutoPage / AutoPage.readme < prev    next >
Encoding:
Text File  |  1998-02-01  |  3.4 KB  |  83 lines

  1. Short:    Arexx script to collect html documents. v0.6
  2. Author:   Arne Seime <aseime@iname.com>
  3. Uploader: Arne Seime <aseime@iname.com>
  4. Type:     comm/www
  5. Requires: HTTPJ (comm/www/HTTPJ200.lha), rexxsupport.library
  6. Version:  0.4
  7. Replaces: AutoPage0.4.lha
  8.  
  9. The script is freeware, but feel free to send me an email if you use it or
  10. has bug reports/suggestions.
  11.  
  12. Idea: Cut the phonebill costs.
  13. Result: Simple and probably buggy arexx script to collect html pages. Works for me.
  14.  
  15. You probably have a lot of html pages you check every time you are
  16. online to see if there has been any changes. I do. The script uses
  17. HTTPJ to check for updates/changes, and if found, it gets the page.
  18. Results are presented in a html page.
  19.  
  20. Installation: 
  21. Get hold of HTTPJ and place the executable in the same directory as 
  22. AutoPage.rexx, httpj.rexx and sitelist.txt. rexxsupport.library (in lowercase) 
  23. should be placed in sys:libs. Autopage.prefs should be in ENV: (And ENVARC: 
  24. ofcourse)
  25.  
  26. Configuration: 
  27. From now on, I've included a prefs file. Should look like this:
  28.  
  29. [Chopped rigth from the script]
  30.     Say "<savedir>        /* Directory to save pages in*/"
  31.     Say "<progdir>        /* Directory where program files are located */"
  32.     Say "<connections>    /* Number of connections to run at the same time */"
  33.     Say "<loop delay>    /* Time in 1/50 sec. Time to wait for ready connection */"
  34.     Say "<buffers>        /* Download buffer in kb each connection */"
  35.  
  36. Add/remove sites in sitelist.txt as you want to with an editor. The format should 
  37. be like this:
  38.  
  39. URL IMAGES SHOW
  40.  
  41. URL:    The address. Dont forget to remove the protocol ("http://").
  42. IMAGES: Get images as well as the html page. 0 means no, 1 yes.
  43. SHOW:   Present the result. Useful to turn off when the page is a part
  44.         of a frameset. This is because HTTPJ don't seem to handle frames at all.
  45.         Example: The IBrowse support page will be like this:
  46.  
  47.         www.omnipresence.com/ibrowse/index.html 1 1
  48.         www.omnipresence.com/ibrowse/menue_f.html 1 0
  49.         www.omnipresence.com/ibrowse/home_f.html 1 0
  50.  
  51. This will get the whole thing, but not bother you with two extra items on the
  52. result html page.
  53.  
  54. Also be aware that some servers always present their pages as "new" ones, and 
  55. therefore HTTPJ get them even if they really are the same as last time you checked.
  56.  
  57. Another problem I've come across is that HTTPJ on certain pages gets images even
  58. when I tell it not to. I think this is a bug in HTTPJ, and I've tried to get in
  59. touch with the author Piergiorgio Ghezzo, but with negative result. If anyone knows
  60. how to get in touch with him via email, please mail me the address.
  61.  
  62. Future: 
  63. Make it work from IBrowse.
  64. Add direct link to the original page.
  65. Probably a lot of bug fixes.             [Done. Well, at least two of them :)]
  66. Use browser hotlist as sitelist.
  67. Get more than one page at a time.        [Done]
  68.  
  69. History:
  70. Version 0.6, sencond release.
  71.  
  72. [Chopped from the script]
  73. ** CHANGES SINCE 0.4:
  74. ** - Added progdir so script can be run from any path, not just current dir.
  75. ** - Fixed a time convertion bug that occured if a disk file was dated
  76. **   xx:00:xx. Strange I didn't discovered it before :)
  77. ** - The result page are temporary stored in ram to keep disk fragmentation down.
  78. ** - sitelist.txt was not closed when exiting.
  79. ** - Added possibility to recieve several pages at a time.
  80. ** - Added a prefs file - a few more options.
  81.  
  82. Disclaimer: My bad "Sunday-after-a-real-though-Saturday-Night-English".
  83.